فهرست مطالب

Journal of Iranian Statistical Society
Volume:10 Issue: 2, 2011

  • تاریخ انتشار: 1390/09/30
  • تعداد عناوین: 9
|
  • صفحه 95
    ولچ و پیرز (1 9 6 3) از یک پیشین ریشه اطلاع برای به دست آوردن احتمال های پسین برای مدل نمایی پارامتر عددی استفاده کردند و نشان دادند که این احتمال های بیزی به طور مجانبی از ویژگی اطمینان مرتبه دوم برخوردارند. یکی از تبعات ضمنی مهم این نتیجه خاطر نشان می کند که باز پارامتری سازی با اطلاع ثابت، ساختار مدل مکانی را در اختیار می گذارد که ویژگی اطمینان دانسته بوده و معلوم است. این مقاله، نقش مدل نمایی پارامتر عددی را برای به دست آوردن احتمال های تقریبی و سطوح اطمینان تقریبی را بررسی کرده، سپس به بحث توسیع آن برای مدل نمایی پارامتر برداری می پردازد.
  • صفحه 109
    یک بررسی متداول برای پژوهیدن اثر متقابل ژن-محیط به صورتی که طولی و جمعیت پایه باشد، طراحی می شود. داده های ناشی از بررسی های پیوند طولی اغلب شامل پاسخ های گمشده اند. تحلیل ساده انگارانه بدون در نظرگرفتن گمشدگی ممکن است استنباطی نامعتبر تولید کند، به ویژه زمانی که سازوکار داده های گمشده به فرایند پاسخ وابسته باشد. در این مقاله، برای پرداختن به این موضوع در تحلیل ناظر به اثرهای متقابل ژن-محیط، رویکرد معادله های برآوردگر تعمیم یافته ی موزون احتمال وارون IPWGEE به انجام استنباط آماری را در پیش می گیریم. این رویکرد از آن رو جذاب است که به مشخص سازی مدل کامل نیاز ندارد، با این حال می تواند برآوردهای سازگار را تحت سازوکار گم شدن تصادفی (MAR) فراهم سازد. از این روش برای تحلیل داده های برآمده از یک بررسی بیماری قلبی عروقی بهره می گیریم
  • صفحه 125
    گزینش متغیر از طریق برآورد تاوانیده برای کاهش بعد برخوردار از جذابیت است. برای رگرسیون خطی تاوانیده، افران و همکاران (2004) الگوریتم LARS را مطرح کردند. اخیرا الگوریتم نزول مختص (CD) توسط فریدمن و همکاران (2007) برای رگرسیون خطی تاوانیده و رگرسیون لوژستیک تاوانیده پرورده و نشان داده شد که برتری محاسباتی به دست می آید. این مقاله به کاوش در الگوریتم CD دو برآورد واگرایی برگمن (BD) تاوانیده برای رده ای گسترده تر از مدل ها می پردازد که نه تنها مدل خطی تعمیم یافته را، که در نوشتگان مربوط به تاوانیدن به حد کفایت مطالعه شده، در بر می گیرد، بلکه مدل شبه درست نمایی را، که کمتر پرورده شده، شامل می شود. مطالعه براساس شبیه سازی و کاربرد داده های واقعی، عملکرد الگوریتم های CD و LARS را در برآورد رگرسیونی، گزینش متغیر و شیوه ی رده بندی موقعی که تعداد متغیرهای تبیینی در مقایسه با اندازه نمونه بزرگ است، تشریح می کند.
  • صفحه 141
    این مقاله به بحث مساله ای درباره ی پیجویی تعداد چندگانه بسامدها با استفاده از تقریب اتورگرسیو منطم ساخته (RAR) می پردازد. شیوه ی RAR به ما اجازه ی کاهش تقریب را، در مقایسه با دیگر روش های آشکارسازی بسامد اتورگرسیو مبنا می دهد، در حالی که هنوز واریانس برآوردهای نمونه ای قابل قیاسی در اختیار می گذارد. نشان می دهیم که برآوردهای RAR از دوره های تناوب چندگانه در احتمال سازگارند و ساز و کار RAR را نسبت به اندازه نمونه و سهم سیگنال به نویز را به کمک شبیه سازی تشریح خواهیم کرد.
  • صفحه 167
    هنگام به کارگیری روش K - نزدیک ترین همسایه (KNN)، عدم حتمیت موجود در انتخاب K اغلب نادیده گرفته می شود. برای به حساب آوردن چنین عدم حتمیتی، KNN بیزی (BKNN) پیشنهاد شده و بررسی شده است. [هولمز و آدامز (2002)، کوکالا و همکاران (2009)] شواهدی عرضه می کنیم که نشان می دهند رویکرد شبه درست نمایی برای BKNN، حتی پس از تصحیح شدن توسط [کوکالا و همکاران (2009)]، هنوز هم عدم حتمیت مدل را به طور معنی داری کم برآورد می کند.
  • صفحه 181
    کاربست مدل های آمیخته برای خوشه بندی و رده بندی به زیرشاخه ای مهم از تحلیل چندمتغیره تکوین یافته است. این رویکردها حدود نیم سده حضور داشته اند، اما فعالیت معنی دار در این زمینه طی دهه ی گذشته بوده است. تاکید اولیه این مقاله مروری بر کارهای انجام شده در خوشه بندی، رده بندی و تحلیل تشخیصی، با توجه خاص معطوف به دو فن است که می توانند با استفاده از بسته های R مربوط به اجرا درآیند. برآورد پارامتر و مدل گزینی نیز مورد بحث قرار می گیرند. مقاله با خلاصه، بحث و برخی تأملات درباره کارهای آینده پایان می یابد.
  • صفحه 201
    گزینش متغیر (خصیصه) توجه زیادی را در آموزش های آماری معاصر و پژوهش های علمی اخیر به خود جلب کرده است. این امر عمدتا ناشی از پیشرفت سریع در فناوری نوین است که به دانشمندان اجازه می دهد داده هایی با اندازه ها و پیچیدگی بی سابقه را گردآوری کنند. یک نوع از مسائل آماری در چنین کاربردهایی به مدل بندی یک متغیر خروجی به عنوان تابعی از زیرمجموعه ای کوچک از تعداد زیادی خصیصه مربوط می شود. در برخی کاربردها، نمونه های داده ها ممکن است حتی از زیرجامعه های چندگانه برخواسته باشند. در این موارد، گزینش خصیصه ها (متغیرها) با قابلیت های پیشگویی درست برای هر زیرجامعه، جنبه ای حیاتی دارد. بهترین روش های گزینش زیرمجموعه از نوع کلاسیک برای بسیاری از کاربردهای آماری نوین به لحاظ محاسباتی بیش از حد گران هستند. روش های جدید گزینش خصیصه طی دهه ی گذشته به طور موفقیت آمیزی برای پرداختن به تعداد زیاد متغیرها پروژه شده اند. این روش ها برای گزینش متغیرهای مهم و برآورد کردن اثرات آنها در یک مدل آماری به طور همزمان، طراحی شده اند. در این مقاله، ما مروری بر پیشرفت های اخیر در نظریه، روش ها و پیاده سازی برای مسأله گزینش متغیر درآمیخته متناهی مدل های رگرسیونی ارائه می کنیم.
  • صفحه 237
    در این مقاله صورتی کلی از مدل مکان را بررسی می کنیم. نوعا فرض می شود که جمله ی خطا مطابق با قانونی که به رده ی توزیع های با خطوط تراز بیضوی تعلق دارد، توزیع می شود. برخی انواع برآوردگرهای انقباضی پارامترهای مکان و مقیاس مطرح شده و عبارت های دقیق اریبی و MSE به دست آمده است. عملکرد برآوردگرهای تحت مطالعه به طور کامل مورد تحلیل قرار گرفته و شرط برتری هر برآوردگر به تفضیل بررسی شده است.
  • صفحه 267
    مسئله پیشگویی متغیر پاسخ با استفاده از مجموعه ی متغیرهای کمکی در مدل رگرسیون خطی را در نظر بگیرید. اگر به طور پیشینی معلوم باشد یا گمان رود که زیرمجموعه ای از متغیرهای کمکی در برازش کلی مدل به طور معنی داری سهیم نیستند، مدلی مقید که این متغیرهای کمکی را کنار می گذارد می تواند بسنده باشد. از سوی دیگر، اگر این زیرمجموعه اطلاعاتی سودمند فراهم سازد، روش تربخشی برای به دست آوردن برآورد پارامترها، برآوردگرهای مقید و نامقید را با هم ترکیب می کند. چنین برآوردگری بهتر از برآوردگرهای ماکزیمم درستنمایی کلاسیک عمل می کند. اعتبار هر گونه اطلاع پیشینی می تواند از راه آزمون مقدماتی (پیش آزمون) سنجیده شود، و با توجه به این اعتبار، می تواند به صورت یک قید پارامتری در مدل گنجانده شود. بدین سان، برآوردگر پیش آزمونی، با توجه به برآمد آزمون مقدماتی، بین برآوردگرهای مقید و نامقید انتخاب به عمل می آورد. برای تشریح کاربرد روش برآورد تربخشی و پیش آزمونی، مثال هایی که سه مجموعه داده های واقعی را به کار می گیرند ارائه می شوند. عملکرد برآوردگرهای مثبت- تربخشی و پیش آزمونی با برآوردگر نامقید تحت درجه های متغیر عدم حتمیت اطلاعات پیشینی، مقایسه می شوند. بررسی مونت کارلویی خواص مجانبی برآوردگرهای موجود در نوشتگان را باز تأیید می کند.
|
  • D. A. S. Fraser, A. Naderi, Kexin Ji, Wei Lin, Jie Su Page 95
    Welch & Peers (1963) used a root-information prior to obtain posterior probabilities for a scalar parameter exponential model and showed that these Bayes probabilities had the confidence property to second order asymptotically. An important undercurrent of this indicates that the constant information reparameterization provides location model structure, for which the confidence property was and is well known. This paper examines the role of the scalar-parameter exponential model for obtaining approximate probabilities and approximate confidence levels, and then addresses the extension for the vector-parameter exponential model.
    Keywords: Approximation, approximate probabilities, asymptotics, exponential model, likelihood, likelihood ratio, maximum likelihood departure, p, value
  • Baojiang Chen, Zhijian Chen, Longyang Wu, Lihua Wang, Grace Y. Yi Page 109
    A common study to investigate gene-environment interaction is designed to be longitudinal and population-based. Data arising from longitudinal association studies often contain missing responses. Naive analysis without taking missingness into account may produce invalid inference, especially when the missing data mechanism depends on the response process. To address this issue in the analysis concerning gene-environment interaction effects, in this paper, we adopt an inverse probability weighted generalized estimating equations (IPWGEE) approach to conduct statistical inference. This approach is attractive because it does not require full model specification yet it can provide consistent estimates under the missing at random (MAR) mechanism. We utilize this method to analyze data arising from a cardiovascular disease study.
    Keywords: Generalized estimating equations, genetic association, longitudinal data, missing at random
  • Chunming Zhang, Zhengjun Zhang, Yi Chai Page 125
    Variable selection via penalized estimation is appealing for dimension reduction. For penalized linear regression, Efron, et al. (2004) introduced the LARS algorithm. Recently, the coordinate descent (CD) algorithm was developed by Friedman, et al. (2007) for penalized linear regression and penalized logistic regression and was shown to gain computational superiority. This paper explores the CD algorithm to penalized Bregman divergence (BD) estimation for a broader class of models, including not only the generalized linear model, which has been well studied in the literature on penalization, but also the quasi-likelihood model, which has been less developed. Simulation study and real data application illustrate the performances of the CD and LARS algorithms in regression estimation, variable selection and classification procedure when the number of explanatory variables is large in comparison to the sample size.
    Keywords: Bregman divergence, LARS algorithm, quasi, likelihood, sparsity, Taylor expansion, variable selection
  • Bei Chen, Yulia R. Gel Page 141
    The paper addresses a problem of tracking multiple number of frequencies using Regularized Autoregressive (RAR) approximation. The RAR procedure allows to decrease approximation bias, comparing to other AR-based frequency detection methods, while still providing competitive variance of sample estimates. We show that the RAR estimates of multiple periodicities are consistent in probability and illustrate dynamics of RAR in respect to sample size and signal-to-noise ration by simulations.
    Keywords: Autoregressive approximation, frequency tracking, least squares method, periodic time series, regularization
  • Wanhua Su, Hugh Chipman, Mu Zhu Page 167
    When using the K-nearest neighbours (KNN) method, one often ignores the uncertainty in the choice of K. To account for such uncertainty, Bayesian KNN (BKNN) has been proposed and studied (Holmes and Adams 2002; Cucala et al. 2009). We present some evidence to show that the pseudo-likelihood approach for BKNN, even after being corrected by Cucala et al. (2009), still significantly underestimates model uncertainty.
    Keywords: Bootstrap interval, MCMC, posterior interval, pseudolikelihood
  • Paul D. Mcnicholas Page 181
    The use of mixture models for clustering and classification has burgeoned into an important subfield of multivariate analysis. These approaches have been around for a half-century or so, with significant activity in the area over the past decade. The primary focus of this paper is to review work in model-based clustering, classification, and discriminant analysis, with particular attention being paid to two techniques that can be implemented using respective R packages. Parameter estimation and model selection are also discussed. The paper concludes with a summary, discussion, and some thoughts on future work.
    Keywords: Classification, clustering, discriminant analysis, mclust, mixture models, model, based clustering, model selection, parameter estimation, pgmm
  • Abbas Khalili Page 201
    Variable (feature) selection has attracted much attention in contemporary statistical learning and recent scientific research. This is mainly due to the rapid advancement in modern technology that allows scientists to collect data of unprecedented size and complexity. One type of statistical problem in such applications is concerned with modeling an output variable as a function of a small subset of a large number of features. In certain applications, the data samples may even be coming from multiple subpopulations. In these cases, selecting the correct predictive features (variables) for each subpopulation is crucial. The classical best subset selection methods are computationally too expensive for many modern statistical applications. New variable selection methods have been successfully developed over the last decade to deal with large numbers of variables. They have been designed for simultaneously selecting important variables and estimating their effects in a statistical model. In this article, we present an overview of the recent developments in theory, methods, and implementations for the variable selection problem in finite mixture of regression models.
    Keywords: em algorithm, mixture models, mixture of regression models, penalized likelihood, regularization, variable selection
  • M. Arashi, A. K. Ehsanes Saleh, S. M. M. Tabatabaey Page 237
    In this paper we treat a general form of location model. It is typically assumed that the error term is distributed according to the law belonging to the class of elliptically contoured distribution. Some sorts of shrinkage estimators of location and scale parameters are proposed and their exact bias and MSE expressions are derived. The performance of the estimators under study are completely analyzed and the condition of superiority of each estimator is studied in details.
    Keywords: Elliptically contoured distribution, location model, preliminary test estimator, shrinkage estimator
  • Sm Enayetur Raheem, S. Ejaz Ahmed Page 267
    Consider a problem of predicting a response variable using a set of covariates in a linear regression model. If it is a priori known or suspected that a subset of the covariates do not significantly contribute to the overall fit of the model, a restricted model that excludes these covariates, may be sufficient. If, on the other hand, the subset provides useful information, shrinkage method combines restricted and unrestricted estimators to obtain the parameter estimates. Such an estimator outperforms the classical maximum likelihood estimators. Any prior information may be validated through preliminary test (or pretest), and depending on the validity, may be incorporated in the model as a parametric restriction. Thus, pretest estimator chooses between the restricted and unrestricted estimators depending on the outcome of the preliminary test. Examples using three real life data sets are provided to illustrate the application of shrinkage and pretest estimation. Performance of positive-shrinkage and pretest estimators are compared with unrestricted estimator under varying degree of uncertainty of the prior information. Monte Carlo study reconfirms the asymptotic properties of the estimators available in the literature.
    Keywords: Data analysis, James, Stein estimation, lasso, Monte Carlo simulation, multiple regression, pretest estimation, quadratic risk, RMSE, shrinkage estimation